課程主要是在於更好的優化data transform的時候data本身的優化處理:
Permutation importance:通過隨機排列參數,凸顯出哪些feature才是更重要的:隨機排列之後,對validation影響比較大的是比較重要的,而幾乎沒什麽影響的就是不重要的;
Partial plots:查看不同的feature對預測的影響結果;結果很直觀;
Shap values:查看所有的feature對預測的影響結果;結果可以得出多個推導;
查了一下partial plots和shap values到底有什麽區別:
https://medium.com/@scottmlundberg/good-questions-21052a61b808
partial plots:通過改變參數來改變預測結果的方式,來判斷feature的重要性的;
Shap values:通過測試某些feature對特定sample的影響的方式,來判斷feature的重要性;